Psychologie Lexikon der Argumente

Home Screenshot Tabelle Begriffe

Autor Begriff Zusammenfassung/Zitate Quellen

Marvin Minsky über Bestärkendes Lernen – Lexikon der Argumente

I 76
Bestärkendes Lernen/Minsky: Im Laufe der Lösung eines Problems müssen bestimmte [Software-] Agenten bestimmte andere [Software-] Agenten geweckt haben. Nehmen wir also an, die Belohnung sähe so aus, dass, wenn [Software-] Agent A an der Erregung von [Software-] Agent B beteiligt war, die Wirkung der Belohnung darin besteht, es A in Zukunft irgendwie leichter zu machen, B zu erregen, und es vielleicht auch schwieriger für A zu machen, andere [Software-] Agenten zu erregen.
Problem: [eine solche Maschine] würde schnell lernen, einfache Probleme zu lösen, könnte aber nie lernen, schwierige Probleme wie den Bau von Türmen oder das Schachspiel zu lösen.
Lösung: (...) um komplizierte Probleme lösen zu können, muss jede Maschine von begrenzter Größe in der Lage sein, ihre [Software-] Agenten in verschiedenen Kontexten auf unterschiedliche Weise wiederzuverwenden.
Bestärkung: Problem: Bei der Lösung eines schwierigen Problems geschehen in der Regel mehrere schlechte Züge, bevor man einen guten findet (...).
Um das Erlernen dieser schlechten Züge zu vermeiden, könnten wir eine Maschine entwerfen, die nur das verstärkt, was in den letzten Augenblicken vor dem Erfolg geschah. Aber eine solche Maschine wäre nur in der Lage zu lernen, Probleme zu lösen, deren Lösung nur einige wenige Schritte erfordert. Alternativ könnten wir die Belohnung so konzipieren, dass sie über längere Zeitspannen funktioniert; das würde jedoch nicht nur die schlechten Entscheidungen zusammen mit den guten belohnen, sondern auch andere Dinge auslöschen, die sie zuvor gelernt hat. Wir können nicht lernen, schwierige Probleme zu lösen, indem wir [Software-] Agenten oder ihre Verbindungen unterschiedslos verstärken.
>Software-Agenten/Minsky
, >Handlung/Minsky.
I 77
Lösung: [Unterscheidung zwischen lokalen und globalen Schemen]: Das globale Schema erfordert eine Möglichkeit, nicht nur zu unterscheiden, welche [Software-] Agenten mit ihren Aktivitäten zur Lösung eines Problems beigetragen haben, sondern auch, welche [Software-] Agenten bei welchen Teilproblemen geholfen haben. Zum Beispiel könnte es beim Bau eines Turms nützlich sein, einen bestimmten Block beiseite zu schieben, um Platz für einen anderen zu schaffen. Dann sollte daran erinnert werden, dass Schieben beim Bau eines Turms helfen kann - aber wenn man zu dem Schluss käme, dass Schieben eine allgemein nützliche Sache ist, würden Sie nie wieder einen Turm bauen lassen. >Ziele/Minsky, >Gedächtnis/Minsky, >Intentionen/Minsky.

_____________
Zeichenerklärung: Römische Ziffern geben die Quelle an, arabische Ziffern die Seitenzahl. Die entsprechenden Titel sind rechts unter Metadaten angegeben. ((s)…): Kommentar des Einsenders. Übersetzungen: Lexikon der Argumente
Der Hinweis [Begriff/Autor], [Autor1]Vs[Autor2] bzw. [Autor]Vs[Begriff] bzw. "Problem:"/"Lösung", "alt:"/"neu:" und "These:" ist eine Hinzufügung des Lexikons der Argumente.

Minsky I
Marvin Minsky
The Society of Mind New York 1985

Minsky II
Marvin Minsky
Semantic Information Processing Cambridge, MA 2003

Send Link
> Gegenargumente gegen Minsky
> Gegenargumente zu Bestärkendes Lernen

Autoren A   B   C   D   E   F   G   H   I   J   K   L   M   N   O   P   Q   R   S   T   U   V   W   Z  


Begriffe A   B   C   D   E   F   G   H   I   J   K   L   M   N   O   P   Q   R   S   T   U   V   W   Z